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© Es soil eine Datenschnittstelle zur Wandlung 
zwischen bitparallel und wortseriell vorliegenden Da- 
tenmustern und bitseriell und wortparallel vorliegen- 
den Datenmustern in Verbindung mit einem Parallel- 
rechner geschaffen werden, um die Eingabe und 
Ausgabe der Daten zu beschleunigen. Zu diesem 
Zweck ist dem Parallelrechner ein dreidimensional 
organisierter Daten speicher (66) mit einer dreidimen- 
sionalen Adressierung vor- und/oder nachgeschaltet, 
bei welcher jede Adresse von drei Komponenten 
gebildet ist, von denen eine erste Komponente (x) 
die Wertigkeit eines Bits in einem Wort, die zweite 
Komponente (y) die laufende Zahl des Wortes in 
einer Folge von Worten und die dritte Komponente 
(z) die laufende Zahl der Folge angibt, zu der das 
Wort gehOrt. Dem Datenspeicher ist ein Schaltnetz- 
werk zur Steuerung des Datenspeichers zugeordnet. 
In dem Datenspeicher ist ein ankommender bitparal- 
lel und wortseriell formatierter Datenstrom zwischen- 
speicherbar, wobei die Daten von dem Datenspei- 
cher (66) als bitserielles und wortparalleles Datenmu- 
ster in Form von "Bitebenen" (26) mit gleichen Bit- 
adressen auf einen Parallelrechner (76) aufschaltbar 
sind, und/oder ein vom Parallelrechner (76) geliefer- 
ter, bitseriell und wortparallel als Folge von 
"Bitebenen" organisierter Datenstrom zwischenspei- 



cher, wobei die Daten als bitparaileies und wortse- 
rielles Datenmuster ausgebbar sind. 




Fig. 4 
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Die Erflndung betrifft ein Datenschnittstelle zur 
Wandlung zwischen bitparallel und wortseriell vor- 
liogenden Datenmustern und bitseriell und wortpa- 
rallel in Verbindung mit einem Parallelrechner vor- 
liegenden Datenmustern. 

Speziell betrifft die Erfindung eine Daten- 
schnittstelle fUr fiSchig vernetzte Parallelrechner. 
Solche flSchig vernetzte Parallelrechner werden zur 
Bearbeitung von zweidimensionalen Datenstruktu- 
ren eingesetzt. Dadurch, daB in der Regel jedem 
Wort ein Prozessorelement zugeordnet ist und die 
Operationen gleichzeitig und parallel in alien Pro- 
zessorelementen auf der Datenstruktur durchge- 
fOhrt werden, gestatten solche flSchig vernetzte 
Parallelrechner eine sehr hohe Rechenleistung. 
Diese hohe Rechenleistung laflt sich aber nur dann 
effektiv nutzen, wenn die Eingabe und Ausgabe der 
Daten entsprechend schnell erfolgt. 

Dabei mu/3 eine Umformatierung der Daten vor- 
genommen werden. Dem Rechner wird ein bitpa- 
ralleler, wortserieller Datenstrom zugefuhrt. Die Da- 
ten, z.B. digitalisierte Mefiwerte, laufen nacheinan- 
der ein (wortseriell). Die Bits der einzelnen Daten 
liegen jedoch jeweils gleichzeitig vor (bitparallel). 
Der Rechner verarbeitet aber alle Daten gleichzei- 
tig (wortparallel), aber in jedem Rechentakt von 
jedem Wort nur ein Bit (bitseriell). 

Der Erfindung liegt die Aufgabe zugrunde, eine 
Datenschnittstelle fUr Parallelrechner zu schaffen, 
welche mit geringstmoglichem technischen Auf- 
wand eine schnelle Datenversorgung und/oder eine 
schnelle Datenentsorgung des Parallelrechners ge- 
stattet. 

Erfindungsgemafl wird diese Aufgabe dadurch 
gelost, dafi 

(a) dem Parallelrechner ein dreidimensional or- 
ganisierter Datenspeicher mit einer dreidimen- 
sionalen Adressierung vor- und/oder nachge- 
schaltet ist, bei welcher jede Adresse von drei 
Komponenten gebildet ist, von denen eine erste 
Komponente die Wertigkeit eines Bits in einem 
Wort, die zweite Komponente die laufende Zahl 
des Wortes in einer Folge von Worten und die 
dritte Komponente die laufende Zahl der Folge 
angibt, zu der das Wort gehort, 

(b) dem Datenspeicher ein Schaltnetzwerk zur 
Steuerung des Datenspeichers zugeordnet ist, 

(c) in dem Datenspeicher 

- ein ankommender bitparallel und wortse- 
riell formatierter Datenstrom zwischenspei- 
cherbar ist, wobei die Daten von dem Da- 
tenspeicher als bitserielles und wortparal- 
leles Datenmuster in Form von 
"Bitebenen" mit gleichen Bitadressen auf 
den Parallelrechner aufschaltbar sind, 
und/oder in dem Datenspeicher ein vom 
Parallelrechner gelieferter, bitseriell und 
wortparallel als Folge von "Bitebenen" or- 



ganisierter Datenstrom zwischenspeicher- 
bar ist, wobei die Daten als bitparalleles 
und wortserielles Datenmuster ausgebbar 
sind. 

5 "Dreidimensional organisiert" bedeutet dabei, 

dai3 jedes Speicherelement durch eine aus drei 
Teilen bestehende Adresse gekennzeichnet ist, wo- 
bei jeder dieser Teile getrennt ansprechbar ist. 
Man kann diese drei Teile als "Koordinaten" x,y,z 

w deuten und dadurch die VorgSnge im Datenspei- 
cher anschaulich darstellen. Mit der tatsSchlichen 
raumlichen Anordnung der Speicherelemente hat 
das in der Regel nichts zu tun. Eine "Bitebene" ist 
dementsprechend die Gesamtheit aller Speicher- 

15 elemente, in denen gleichartige Bits, z.B. die ge- 
ringstwertigen Bits, aller Datenworter gespeichert 
sind. 

ZweckmSBigerweise ist zur Adressierung des 
Zwischenspeichers und zur Steuerung der Daten- 

20 wege ein Mikroprogramm vorgesehen. 

Der Zwischenspeicher kann aus zwei Teilberei- 
chen mit jeweils zugehorigem Schaltnetzwerk auf- 
gebaut sein. Dabei kann jeder der Teilbereiche 
sowohl fur die Wandlung des bitparallel und wort- 

25 seriell formatierten Datenstromes in ein wortparallel 
und bitserielles Datenmuster als auch fur die 
Wandlung eines wortparallel bitseriell organisierten 
Datenstromes in ein bitparallel und wortserielles 
Datenmuster eingerichtet sein. Es ist dann moglich, 

30 Daten im bitparallelen, wortseriellen Datenformat in 
einen ersten Teilbereich einzugeben und gleichzei- 
tig aus dem anderen Teilbereich Daten im wortpa- 
rallelen, bitseriellen Datenformat an den Parallel- 
rechner abzugeben. 

35 Vorteilhafterweise sind fGr die beiden Teilberei- 
che unabhangig voneinander ablaufende Mikropro- 
gramme vorgesehen. Die beiden Mikroprogramme 
konnen zum Arbeiten mit unterschiedlichen Daten- 
und Taktraten eingerichtet sein. Dadurch ist es 

40 moglich, mit einem Teilbereich Daten mit einer 
ersten Datenrate im bitparallelen, wortseriellen Da- 
tenformat zu empfangen und gleichzeitig mit dem 
anderen Teilbereich bereits umformatierte Daten 
mit einer zweiten Datenrate an den Parallelrechner 

45 zu ubergeben. Ebenso konnen bei der Datenent- 
sorgung durch einen Teilbereich Daten im wortpa- 
rallelen, bitseriellen Format mit der zweiten Daten- 
rate aus dem Parallelrechner Ubernommen und ge- 
wandelt werden, wahrend gleichzeitig mit dem an- 

50 deren Teilbereich umformatierte Daten bitparallel 
und wortseriell mit einer dritten Datenrate abgege- 
ben werden. 

Ein AusfUhrungsbeispiel der Erfindung ist 
nachstehend unter Bezugnahme auf die zugehori- 

55 gen Zeichnungen nSher erlSutert. 

Fig.1 veranschaulicht die Grobstruktur ei- 
nes einzelnen Prozessorelements bei 
einem Parallelrechner. 
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Fig.2 veranschaulicht die Datenschichten in 
den lokalen Direktzugriffspeichen 
(RAMs) eines als Array von Prozes- 
sorelementen aufgebauten Parallel- 
rechners. 

Fig.3 veranschaulicht die Datenstrukturen in 
einem Array von Prozessorelementen 
bei Eingabe- und Ausgabeoperatio- 
nen. 

Fig.4 veranschaulicht die Strukturwandlung 
der Eingangsdaten bei einer Daten- 
schnittstelle von wortseriell, bitseriell 
ankommenden Daten in "flSchige", 
wortparaliele, bitserietle Daten. 

Fig.5 veranschaulicht die prinzipielle Wir- 
kungsweise der Datenschnittstelle bei 
Datenausgabe-Operationen. 

Fig.6 zeigt die Anordnung der Prozessor- 
elemente in einem als binarer Array- 
Prozessor ausgebildeten Parallelrech- 
ner. 

Fig.7 veranschaulicht in einer perspektivi- 
schen Darstelung das Verbindungs- 
schema der Prozessorelemente unter- 
einander Gber Bausteingrenzen hin- 
weg. 

Fig.8 veranschaulicht in einer perspektivi- 
schen Darstellung das Verbindungs- 
schema von Kommunikations-Regi- 
stern des Parallelrechners. 
Fig.9 ist eine schematisch-perspektivische 
Darstellung und veranschaulicht die 
Struktur der Datenschnittstelle bei der 
Eingabe von Echtzeitdaten. 
Fig.10 ist eine schematisch-perspektivische 
Darstellung und veranschaulicht die 
Struktur der Datenschnittstelle bei der 
Ubertragung der Daten auf ein Array 
von Prozessorelementen. 
Fig.11 ist eine schematisch-perspektivische 
Darstellung und veranschaulicht die 
Struktur der Datenschnittstelle bei der 
Ubertragung von 16 Bit-Daten von ei- 
nem Array von Prozessorelementen 
auf die Datenschnittstelle. 
Fig.12 ist eine schematisch-perspektivische 
Darstellung und veranschaulicht die 
Struktur der Datenschnittstelle bei der 
Ausgabe von 16 Bit-Daten aus der 
Datenschnittstelle. 
Fig.13 zeigt die Grundstruktur der ROM- 

Steuerung der Datenschnittstelle. 
Fig.1 zeigt die Grobstruktur eines einzelnen 
Prozessorelements bei einem Parallelrechner. 

Das Prozessorelement 10 enthart einen Pro- 
zessorteil 12. Der Prozessorteil 12 ist ein 1 Bit- 
Prozessor. Der Prozessorteil 12 ist fur die bitseriel- 
le Verarbeitung beliebiger Operandenlangen auge- 



legt. Der Prozessorteil 12 enthalt in bekannter und 
daher nicht im einzelnen dargestellter Weise eine 
Arithmetik-Logik-Einheit (ALU), Register, 
Kommunikations-Register und Kommunikations-Da- 

5 tenpfade. "Darunter" befinden sich lokale Direkt- 
zugriffspeicher 14 fUr insgesamt 256 Bit. Zu verar- 
beitende Daten liegen bitweise vertikal gestaffeit 
als Schichten 16, 18, 20 in dem lokalen Direktzug- 
riffspeicher 14. 

70 In einem grSBeren Verbund (Fig.2) in einem 
sogenannten Array von Prozessorelementen bilden 
die Datenschichten 16, 18, 20 zweidimensionale 
Strukturen mit Bitebenen 22 bis 24. Jede Daten- 
schicht, z.B. 16 hat eine "Schichtdicke", die durch 

ys die Anzahl der vertikal gestaffelten Speicherele- 
mente in jedem Direktzugriffspeicher 14 bestimmt 
ist. 

Die vertikale Position eines gespeicherten Bits 
bestimmt die Wertigkeit des Bits. In der zweidi- 

20 mensionalen Struktur, z.B. 22, der Datenschichten 
16 kommen zu dieser vertikalen Position noch In- 
formationen Gber die " horizontal" Position des 
Bits in der Datenschicht 16 hinzu. 

Die Datenversorgung und Datenentsorgung 

25 dieser lokalen Direktzugriffspeicher 14 erfolgt durch 
Transfer von "Bitebenen". Das ist in Fig.3 ange- 
deutet. Die Prozessorelemente verfugen fOr die 
Obernahme und den Transport von Bitebenen Ober 
einen speziellen Kommunikationsweg. Dieser Kom- 

30 munikationsweg kann unabhSngig von laufenden 
Rechenoperationen belegt werden. 

Bei der Dateneingabe werden die Daten einer 
Bitebene 26 zunSchst "horizontal", parallel zur 
Ebene des Arrays von Prozessorelementen, in das 

35 Kommunikations-Register des Arrays geladen, das 
aus den Kommunikations-Registern in den Pro- 
zessorteilen 12 der einzelnen Prozessorelemente 
10 aufgebaut ist. Das ist im vorderen Teil von Fig:3 
durch den Pfeil 28 angedeutet. Wenn die Bitebene 

40 26 positionsgenau zu den Prozessorelementen 10 
ausgerichtet ist, werden die Bits dann in die ent- 
sprechenden Speicherzellen der lokalen Direktzug- 
riffspeicher 14 "abgesenkt". Das ist in Fig.3 durch 
den nach unten abgeknickten Pfeil 30 angedeutet. 

45 Die Datenschicht 16 wird dadurch aufgebaut, daJ3 
nacheinander die verschiedenen Bitebenen dieser 
Schicht schrittweise "horizontal" in das 
Kommunikations-Register transportiert und dann 
wieder schrittweise in die Direktzugriffspeicher 14 

so der Prozessorelemente 10 abgesenkt werden. 

Bei der Ausgabe der Daten wird umgekehrt 
verfahren: Die Daten sind in den "Schichten 16, 18, 
20 in den lokalen Direktzugriffspeichern 14 der 
Prozessorelemente 10 gespeichert. Diese Daten 

55 werden dann Bitebene fUr Bitebene "angehoben" 
und in das Kommunikations-Register der Prozess- 
orteile 12 geladen. Das ist in Fig.3 durch Pfeil 32 
angedeutet. Die "angehobene" Bitebene 34, z.B. 
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die Bitebene mit den geringstwertigen Bits der 
verschiedenen Daten, wird dann schrittweise 
"horizontal herausgeschoben" und so ausgegeben. 
Das ist in Fig.3 durch Pfeil 36 angedeutet. 

Ein Parallelrechner der beschriebenen Art ist 
besonders geeignet fUr die Verarbeitung von zwei- 
dimensionalen Datenstrukturen. Solche Datenstruk- 
turen sind beispielsweise Bilddaten. Sensoren He- 
fern fUr jedes Bildelement (Pixel) einen Helligkeits- 
wert. Die Sensoren werden zeiienweise ausgele- 
sen. Es ergibt sich eine Folge von Helligkeitswer- 
ten. Diese Helligkeitswerte werden digitalisiert. Die 
nacheinander erscheinenden digitalen Helligkeits- 
werte bilden einen Datenstrom. In den Daten die- 
ses Datenstromes stehen alle Bits der digitalen 
Helligkeitswerte gleichzeitig zur VerfUgung. Die 
Heiligkeitswerte erscheinen "bitparallel". Die Hellig- 
keitswerte der verschiedenen Bildelemente erschei- 
nen bei einer zeilenweisen Abtastung jedoch zeit- 
lich nacheinander. Die Helligkeitswerte erscheinen 
daher "wortserieir. Es gilt, die bitparallel und wort- 
seriell ankommenden Daten so umzuformatieren, 
dafl sie in der beschriebenen Weise in den Paral- 
lelrechner eingegeben werden ktfnnen. 

Das ist schematisch in Fig.4 dargestellt. Die 
Daten erscheinen seriell in Zeilen 38, 40, 42, 44. 
Jedes Wort besteht aus einer Binarzahl mit Bits 
verschiedener Wertigkeit. Das ist in Fig.4 durch die 
vertikale Dimension dargestellt. Jedes Wort ist so 
durch eine SSuie 46 reprSsentiert. Die Bits jedes 
Worts 46 stehen gleichzeitig, parallel zur VerfU- 
gung. 

Zur Eingabe der Daten in den Parallelrechner 
ist dem Parallelrechner eine Datenschnittstelle 48 
vorgeschaltet. Diese Datenschnittstelle 48 enthalt 
einen dreidimensional organisierten Speicher. 
"Dreidimensional organisiert" bedeutet dabei, dafi 
die Adresse jedes Speicherelementes drei einzeln 
ansprechbare Bestandteile hat, die drei 
"Dimensionen" entsprechen. Eine dieser Dimensio- 
nen ist die Wertigkeit des jeweiligen Bits. Eine 
andere Dimension kann beispielsweise die Zeile 
38, 40,42 oder 44 angeben, eine weitere Dimension 
entspricht der Position des Worts in der betreffen- 
den Zeile. Das kann durch eine dreidimensionale 
Darstellung wie in Fig.4 anschaulich gemacht wer- 
den. In die Datenschnittstelle mit dem dreidimen- 
sional organisierten Speicher werden die Daten 46 
seriell Zeile fUr Zeile eingegeben. Das ist durch 
einen Pfeil 50 in Fig.4 dargestellt. Danach werden 
die so gespeicherten Daten Bitebene fOr Bitebene 
"waagerecht" herausgeschoben und in den Paral- 
lelrechner in der beschriebenen Weise eingegeben. 
Das ist in Fig.4 durch Pfeil 52 dargestellt. Mit 54 ist 
in Fig.4 die Bitebene mit den geringstwertigen Bits 
bezeichnet "Darunter" liegen die Bitebenen 56 mit 
den hoherwertigen Bits. 

Die Ergebnisse der Berechnungen liegen bei 



dem Parallelrechner in Form von Datenschichten in 
den lokalen Direktzugriffspeichern 14 der Prozes- 
sorelemente 10 vor. Ahnlich wie bei der Eingabe- 
operation erfolgt die Ausgabe dieser Daten sequen- 

5 tiell, indem nacheinander die einzelnen Bitebenen 
in die Datenschnittstelle Ubertragen werden. Das ist 
in Fig.5 schematisch dargestellt. Dabei ist ange- 
nommen, daB die Ergebnisse in 16 Bitebenen vor- 
liegen. Die OperandenlMnge ist also 16 Bit. 

w Die Bitebenen 58, 60, 62, 64 usw. werden aus 
den Direktzugriffspeichern 14 nacheinander in die 
Kommunikations-Register "angehoben" und 
"waagerecht" in einen dreidimensional organisier- 
ten Speicher 66 einer Datenschnittstelle 68 Ubertra- 

75 gen. Das ist durch Pfeil 70 in Fig.5 dargestellt. 
Nachdem alle Bittebenen 58, 60, 62, 64 usw. aus 
den Direktzugriffspeichern 14 der Prozessorele- 
mente 10 in den Speicher 66 Ubertragen worden 
sind, werden die Daten dann bitparallel und wortse- 

20 riell ausgegeben. Das ist in Fig.5 durch Pfeil 72 
dargestellt. 

Der dreidimensional organisiert© Speicher 66 
enthalt als erste "Dimension", d.h. Adressenbe- 
standteil, x die Wertigkeit des Bits, als zweite Di- 

25 mension y die Position des Worts in der Zeile und 
als dritte Dimension z die Nummer der Zeile. 

Zum Obertragen einer Bitebene wird die x- 
Adresse, welche die Bitebene 58, 60, 62 oder 64 
des Speichers 66 festgehalten. Die y-Adresse wird 

30 auf "0" gestellt, entsprechend der ersten 
"vertikalen" Schicht des Speichers 66. In "z-Rich- 
tung" werden so viele Speicherelemente wie Bitsi- 
gnale in dieser "z-Richtung" am Parallelrechner 
anstehen zum Schreiben freigegeben. Die Bits der 

as ersten Spalte der Bitebene 58 des Parallelrechners 
werden dann parallel auf die "rechte obere" Spalte 
des Speichers 66 Obertragen. Es werden somit in 
Fig.5 zunachst aus der Bitebene 58 die Inhalte der 
Speicherelemente 0, 8, 16, 24 auf die entsprechen- 

40 den Speicherelemente des Speichers 66 Ubertra- 
gen. Es wird dann die y-Adresse schrittweise auf 1, 
2, 3 usw. erhoht und jedesma! die Inhalte der 
Speicherelemente einer Spalte auf die entspre- 
chenden Speicherelemente, z.B. 1, 9, 17, 25, des 

45 Speichers 66 Ubertragen, bis der gesamte Inhalt 
der Bitebene 58 auf die oberste Ebene des Spei- 
chers 66 Ubertragen ist. 

Wenn die Bitebene 58 vollstandig in den Spei- 
cher 66 Ubertragen ist, wird die Bitebene 60 im 

so Parallelrechner in das Kommunikations-Register 
angehoben. Gleichzeitig wird die x-Adresse urn 
eins erhoht. Die y-Adresse wird auf null zurUckge- 
steilt. In der beschriebenen Weise werden nun die 
Inhalte der zweiten Bitebene 60 des Parallelrech- 

55 ners auf die zweitoberste Ebene des Speichers 66 
Ubertragen. Durch Inkrementierung der x-Adresse 
und "Anheben" der Bitebenen 62, 64 usw. in das 
Kommunikations-Register des Parallelrechners wer- 
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den nacheinander alle sechzehn Bitebenen des Pa- 
rallelrechners, in denen die Ergebnisse der Re- 
chenoperationen gespeichert sind, in den Speicher 
66 Ubertragen. Die Daten sind dann durch die 
"vertikal" angeordneten Bits wieder jeweils voll- 
standig im Speicher 66 gespeichert. 

Aus dem Speicher 66 werden die Daten dann 
bitparailel und wortseriell ausgelesen. Zu diesem 
Zweck wird zunachst die z-Adresse auf den An- 
fangswert gestellt. Es werden parallel alle sechzehn 
x-Adressen zum Auslesen aktiviert. Dann werden 
die y-Adressen inkremental erhoht. Auf diese Wei- 
se wird zunSchst die in Fig.5 "vorderste, vertikale" 
Schicht des Speichers von "rechts nach links" aus- 
gelesen, wie das durch den Pfeil 72 angedeutet ist. 
Danach wird die z-Adresse urn eins erhoht und die 
nachste Schicht ausgegeben. Es entsteht so ein 
Datenflufl von bitparailel, wortseriell auftretenden 16 
Bit-Daten. Diese Daten werden an eine weitere 
Verarbeitungsstufe Cibergeben. 

Nachstehend wird eine technische Realisierung 
des vorstehend erlauterten Prinzips unter Bezug- 
nahme auf die Figuren 6 bis 13 im einzelnen 
beschrieben. 

Fig.6 zeigt einen Parallelrechner 76, wie er in 
Verbindung mit der Datenschnittstelle 68 verwendet 
wird. 

Der Parallelrechner 76 enthalt vierundsechzig 
einzelne Prozessorelemente 10 der in Fig.1 darge- 
stellten Art. Die Prozessorelemente 10 sind in einer 
quadratischen Matrix angeordnet, so da/3 der Paral- 
lelrechner acht Zeilen von jeweils acht Prozessor- 
elementen 10 enthalt. Wie schon in Verbindung mit 
Fig.1 beschrieben wurde, enthalt jedes Prozessor- 
element 10 einen Prozessorteil 12 und einen loka- 
len Direktzugriffspeicher (RAM) 14. In Fig.6 hat 
jeder Direktzugriffspeicher zweihundertsechsund- 
fllnfzig Speicherelemente, die hier "Ubereinander" 
vom Speicherelement 78 des hochstwertigen Bit 
zum Speicherelement 80 des geringstwertigen Bit 
dargestellt sind. Die Prozessorteile 12 enthalten 
neben den eigentlichen Prozessorbauteilen ein 
Kommunikations-Register. Das Kommunikations- 
Register jedes Prozessorelements 10 kann Daten 
in einer Richtung von "Ost" nach "West" jeweils 
bis zum benachbarten Prozessorelement ubertra- 
gen. Diese Ubertragung ist auch uber die Grenzen 
des als Baustein ausgebildeten Parallelrechners 76 
hinweg moglich. Es konnen daher mehrere solcher 
Parallelrechner kombiniert werden. Jedes 
Kommunikations-Register kann direkt bitweise Da- 
ten in den Zugehdrigen lokalen Direktzugriffspei- 
cher einschreiben und aus diesem auslesen. Die 
Gesamtheit der Kommunikations-Register bildet 
eine Transportschicht". Auf der Transportschicht 
konnen unabhangig von laufenden arithmetischen 
Operationen Daten in Ost-West-Richtung transpor- 
tiert werden. Diese "Transportschicht" ist in Fig.6 



durch Pfeile 82 dargestellt. 

In Fig.7 sind vier Parallelrechner der in Fig.6 
dargestellten Art zusammengeschaltet. Die vier Pa- 
rallelrechner sind in Fig.7 mit 76A, 76B, 76C und 

5 76D bezeichnet. Die Prozessorelemente 10 sind in 
Fig.7 jeweils durch die zugehorigen 
Kommunikations-Register 84 symbolisiert. Die 
Kommunikations-Register 84 Widen in ihrer Ge- 
samtheit die Transportschicht. 

w Die eigentlichen Prozessorteile 12 sind Ober 
bidirektionale Ost-West-Verbindungen Ober die 
RSnder der einzelnen Parallelrechner 76A, 76B, 
76C und 76 D hinaus miteinander verbunden. Die- 
se Verbindung folgt einem maanderformig hin- und 

75 hergehenden Pfad, so daB sich eine durchgehende, 
maanderformige Kette von Prozessorteilen ergibt. 
Diese Verbindungen sind nicht die Verbindungen 
zwischen den Kommunikations-Registern sondern 
die Signalwege zwischen den Rechenregistern der 

20 einzelnen Prozessorteile 12. Durch diese maander- 
formige Verbindung ergibt sich fUr den gesamten 
Flachenrechner eine quasilineare Struktur aus 
zweihundertsechsundfOnfzig Prozessorelementen. 
Darin hat jedes Prozessorelement eine teste Posi- 

25 tionsnummer. 

Die Kommunikations-Register 84 sind nur in- 
nerhalb jedes einzelnen Parallelrechner-Bausteins 
76A, 76B, 76C und 76 D in Ost-West-Richtung 
unidirektional miteinander verbunden. Eine Verbin- 

30 dung zwischen den einzelnen Parallelrechner-Bau- 
steinen besteht fUr die Datenpfade der 
Kommunikations-Register 84 nicht. 

FUr die Einspeisung von Daten in den Rechner 
existieren vier Eingabepunkte 86A, 86B, 86C und 

35 86D mit einer Breite von je acht Bit. Das gleiche 
gilt fur die Ausgabe von Daten. Auch hier gibt es 
vier Ausgabestellen 88A, 88B, 88C und 88D mit 
einer Breite von je acht Bit (Fig.8). Daten, die in 
das Array von Prozessorelementen eingegeben 

40 werden, werden Ober den "Ostrand" zugefUhrt. Da- 
ten, die von dem Array ausgegeben werden, ver- 
lassen die Transportschicht Gber den "Westrand". 
Die aus den Kommunikations-Registern bestehen- 
de Transportschicht kann aus den Direktzugriffspei- 

45 chern 14 der verschiedenen Prozessorelemente 10 
in nur einem Arbeitszyklus geladen werden. Urn 
jedoch die vierundsechzig Bit der Transportschicht 
eines Parallelrechner-Bausteins Ober den Westrand 
auszugeben, werden acht Schiebezyklen benotigt. 

so In gleicher Weise werden acht Schiebezyklen be- 
notigt, urn alle vierundsechzig Speicherelemente 
der Transportschicht eines Parallelrechner-Bau- 
steins Ober den Ostrand mit Datenbits zu laden, 
d.h. eine Bitebene in der Transportschicht aufzu- 

55 bauen. Das "Absenken" dieser Bitebene in die 
lokalen Direktzugriffspeicher 14 erfolgt wiederum 
parallel fUr alle vierundsechzig Prozessorelemente 
und erfordert daher nur einen Arbeitszyklus. 
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Die Aufgabe der Datenschnittstelle besteht nun 
darin, zweihundertsechsundfUnfzig Datenworte von 
je acht Bit, die wortseriell und bitparallel einlaufen, 
so in den Speichern der Datenschnittstelle abzule- 
gen, daB die Daten mtiglichst effizient Bitebene fUr 
Bitebene Uber die Kommunikations-Register 84 in 
die Direktzugriffspeicher 14 der Prozessorelemente 
10 Obertragen werden. Das ist prinzipiell in Fig.9 
dargestellt. 

Die Datenschnittstelle, die genereil mit 68 be- 
zeichnet ist, enthalt vier Speicherblocke 66A, 66B, 
66C und 66D. Jeder der Speicherblocke hat eine 
SpeicherkapazitSt von 8X32 Bytes. Das Eingeben 
von Daten erfolgt bitparallel fOr jeweils acht Bit. 
Jeder Speicherblock 66A, 66B, 66C und 66D be- 
sitzt eine eigene Schreibfreigabe-Leitung 90A, 90B, 
90C bzw. 90D. FGr das Eingeben der Daten in die 
Speicherblocke 66A, 66B, 66C und 66D sind acht 
Adressenbits erforderlich: FOnf Adressenbits adres- 
sieren die Speicherbltfcke 66A, 66B, 66C bzw. 66D 
in "z-Richtung" mit den Speicherzellen "0" bis 
"31, drei Adressenbit werden fUr die Adressierung 
in der "x-Richtung" mit den Schichten "0" bis "7" 
benotigt. Eine Adressierung in der "y-Richtung" 
entfallt, da die Daten mit acht Bit parallel einge- 
schrieben werden. Die vier Dateneingang 92A, 
92B, 92C und 92D von jeweils acht Bit sind fUr 
diese Operation durch ein extern es Steuersignal 
parallelgeschaltet. Durch ein Steuersignal an einem 
der Schreibfreigabe-Leitungen 90A, 90B, 90C Oder 
90D wird jeweils einer der Speicherblocke 66A, 
66 B, 66C bzw. 66D ausgewahlt. 

Vor Beginn der DatenUbernahme wird die x- 
Adresse auf die erste "vertikale" Schicht gestellt. 
Es wird x = 0 gesetzt. In z-Richtung wird die erste 
Spalte adressiert, also z = 0 gesetzt. Zur Daten- 
Ubernahme wird die Schreibfreigabe-Leitung 90A 
des ersten Speicherblocks 66A aktiviert. Das erste 
Wort von acht Bit wird dann in der Speicherzelle 
mit der Adresse x = 0, z = 0 gespeichert. Dann wird 
die z-Adresse schrittweise jeweils urn eins erhoht, 
wobei nacheinander die darauffolgenden sieben 
Daten in der ersten "linken" Schicht des Speicher- 
blocks 66A abgespeichert werden bis zu der 
Adresse z = 7. Dann werden wieder die x-Adresse 
und die z-Adresse auf "0" zuruckgesetzt und statt 
der Schreibfreigabe-Leitung 90A des ersten Spei- 
cherblocks 66A die Schreibfreigabe-Leitung 90B 
des zweiten Speicherblocks 66B aktiviert. Es er- 
folgt jetzt eine Speicherung der na'chsten acht Da- 
ten in der ersten "linken" Schicht des Speicher- 
blocks 66B. In gleicher Weise werden aufeinander- 
folgend die ersten Schichten des zweiten und des 
dritten Speicherblocks 66C bzw. 66D mit je acht 
Daten bis zu dem Wort Nr. 31 aufgefUIH. Danach 
wird die x-Adresse urn eins erhoht. Die 
Schreibfreigabe-Leitung 90A wird wieder aktiviert. 
Mit den z-Adressen von "0" bis "7" werden begin- 



nend mit Wort Nr.32 die nSchsten acht ankommen- 
den Daten in der zweiten Schicht des ersten Spei- 
cherblocks 66A gespeichert. Dann wird durch An- 
steuem der Schreibfreigabe-Leitung 90B auf den 

5 zweiten Speicherblock 66B der Datenschnittstelle 
68 umgeschaltet usw. In der Darstellung von Fig.9 
wird gerade das Wort Nr. 41 in den Speicherblock 
90B eingeschrieben. Der beschriebene Ablaut wie- 
derholt sich, bis aile Speicherblocke 66A, 66B, 66C 

10 und 66D in x-Richtung mit acht "vertikalstehenden" 
Datenschichten gefUllt sind. Das ist dann der Fall, 
wenn das Wort Nr.255 in Speicherblock 66D in der 
Speicherzelle mit der X-Adresse "7" und der z- 
Adresse "7" eingetragen wurde. In den vier Spei- 

75 cherblSckeh stehen dann vier Datenbl6cke im For- 
mat von 8x8 Bytes. Diese Datenblocke sind zudem 
so angeordnet, 6aB sie der "quasi-linearen" Anord- 
nung der Prozessorelemente 10 von Fig .7 unmittel- 
bar entsprechen. 

20 Damit ist die Schreiboperation fUr das gewShlte 
Format der Sensordaten abgeschlossen. 

Wie oben schon erwahnt, ist die Datenschnitt- 
stelle in zwei unabhangig voneinander zu betrei- 
bende Speicherbereiche aufgeteilt. Wahrend einer 

25 dieser Speicherbereiche Daten in der vorstehend 
beschriebenen Weise von auflen Qbernimmt, wird 
der jeweils andere ausgelesen und Ubertragt Daten 
auf den Parallelrechner. Diese Leseoperation ge- 
hort ebenfalls zur Dateneingabe. Die zugehorige 

30 Struktur zeigt Fig.10. 

Im Gegensatz zu der Betriebsart "Schreiben", 
bei der "vertikal stehende" Datenkolumnen von 
acht Bit H6he eingetragen werden, mdssen bei der 
Betriebsart "Lesen" "horizontale" Bitebenen aus- 

35 gelesen werden. Zu diesem Zweck sind die Aus- 
gange der vier Speicherblocke 66A, 66B, 66C und 
66D Uber eine Breite von acht Bit mit den EingSn- 
gen der aus den Kommunikations-Registern 84 der 
Prozessorelemente 10 aufgebauten Transport- 

40 schicht verbunden. Das ist in Fig. 10 dargestellt. 

Zum Auslesen werden die y-Adressen zu- 
nachst auf "7" gestellt. Damit wird die Bitebene mit 
dem geringstwertigen Bit adressiert. In x-Richtung 
werden alls acht Ausgange jedes Speicherblocks 

45 66A, 66B, 66C, 66D aktiviert. Die Schreibfreigabe- 
Leitungen aller Speicherbl6cke 66A, 66B, 66C und 
66D sind inaktiv. Dadurch wird ein Oberschreiben 
von Daten verhindert. Die z-Adresse wird auf "0" 
gestellt. An den Eingangen der Transportschicht 

so stehen daher die Daten Nr. 0, 32, 64, 96... fUr den 
Parallelrechner-Baustein 76A, bzw. Nr. 8, 40, 72, 
104 .. fur den Parallelrechner-Baustein 76 B usw. 
an. Mit jedem Arbeitstakt des Parallelrechners wer- 
den nun 

55 - die an den Parallelrechner-Bausteinen 76A, 
76B, 76C und 76 D anstehenden Daten Uber 
den "Ostrand" der Transportschicht in die 
diesen Ostrand bildenden Kommunikations- 
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Register 84 Ubernommen, 

- die in der Transportschicht gespeicherten Da- 
ten in einer Breite von acht Bit urn einen 
Schritt von Ost nach West weitergeschoben 
und 

- die z-Adressen jeweits um eins erhoht. 

Das Auslesen der Datenschnittstelle erfolgt 
demgema/J bei der Eingabe von Daten mit der 
Taktrate des Parallelrechners. Dadurch, dafl die in 
die Datenschnittstelle eingeschriebene Datenstruk- 
tur im Format von 8x8 Bytes dem geometrischen 
Format der Parallelrechner-Bausteine 76A, 76B, 
76C und 76D entspricht und eine Aufteilung des 
Speichers der Datenschnittstelle 68 in vier Spei- 
cherblScke 66A, 66B 66C und 66D erfolgt, genU- 
gen lediglich acht Arbeitstakte, um die gesamte 
Information einer Bitebene der Eingangsdaten in 
die Transportschicht mit den Kommunikations-Re- 
gistern 84 des Parallelrechners zu laden. Nach acht 
Arbeitstakten hat die z-Adresse den Zustand "8" 
erreicht und den Bereich gOltiger Eingangsdaten 
verlassen. In dem nun folgenden Arbeitstakt wird 

- die z-Adresse auf "0" zurUckgestellt, 

- die y-Adresse um eins vermindert und 

- die in der Transportschicht stehende Bitebe- 
ne in den entsprechenden Bereich der Direkt- 
zugriffspeicher 14 der Prozessorelemente 10 
abgesenkt. 

Die Datenausgange bleiben in x-Richtung in 
einer Breite von acht Bit aktiviert, so dafi nun die 
nachste Bitebene angewahlt ist und in der be- 
schriebenen Weise in die Transportschicht des Pa- 
rallelrechners UberfUhrt werden kann. Dieser Ablaut 
wiederholt sich acht Mai, bis die y-Adresse den 
Zustand "0" erreicht hat und in z-Richtung alle 
gultigen Daten ausgelesen sind. Insgesamt werden 
fUr die Obertragung eines Datensatzes vom Format 
256x8 Bit 

N GES = 8x (8 + 1) = 72 

Arbeitstakte benotigt Bei einer Arbeitsfrequenz von 
z.B. 16 MHz ergibt sich fOr einen Arbeitstakt des 
Parallelrechners eine Dauer von 62,5 ns. Fur die 
beschriebene Leseoperation werden damit lediglich 
4,5 us benotigt. 

Bei der Ausgabe von Daten aus dem Parallel- 
rechner 76 besteht die Aufgabe, 256 in dem Paral- 
lelrechner gespeicherte Ergebnisvariable mit einer 
WortlSnge von bis zu sechzehn Bit Ober die von 
den Kommunikations-Registern 84 gebildete Trans- 
portschicht Bitebene fUr Bitebene zu entladen und 
als Folge von zweihundertsechsundfUnfzig Worten 
von je sechzehn Bit an eine nachgeschaltete Re- 
cheneinheit zu ubergeben. Wie bei der Eingabe 
von Daten besteht diese Operation aus zwei Teil- 
operationen, einer Schreiboperation und einer Le- 
seoperation. Diese beiden Teiloperationen werden 



wie bei der schon beschriebenen Eingabe von Da- 
ten in den Parallelrechner parallel in zwei Speicher- 
teilen des Speichers 66 der Datenschnittstelle 68 
durchgefUhrt. 

5 Fig.11 zeigt die Struktur der Datenschnittstelle 

68 bei der Schreiboperation, bei welcher Ergebnis- 
variable aus dem Parallelrechner in den Speicher 
66 der Datenschnittstelle 68 eingeschrieben wer- 
den. 

70 Da am Ausgang der Datenschnittstelle 68 Da- 
ten mit sechzehn Bit bereitgestellt werden mussen, 
die Datenwege der Speicherblocke 66A, 66B, 66C 
und 66D jeweils nur acht Bit breit sind, werden 
jeweils zwei Speicherblocke 66A und 66B bzw. 

75 66C und 66D fUr die Obernahme der Ausgangsda- 
ten zusammengeschaltet. Das ist in Fig.11 fUr die 
Parallelrechner-Bausteine 76A und 76 B dargestellt 
Die Speicherbldcke 66A und 66B Obernehmen die 
Ausgangsdaten von dem Parallelrechner-Baustein 

20 76A. Die Speicherblocke 66C und 66D Oberneh- 
men die Ausgangsdaten von dem Parallelrechner- 
Baustein 76B. FUr die Obernahme der Ausgangs- 
daten der Parallelrechner-Bausteine 76C und 76D 
mu6 eine weitere Datenschnittstelle der beschrie- 

25 benen Art vorgesehen werden. Das ist in Rg.11 
nicht dargestellt. Dementsprechend ist der Aus- 
gang 100A des Parallelrechner-Bausteins 76A pa- 
rallel mit den EingSngen 102A und 102B der Spei- 
cherblocke 66A und 66B verbunden. Der Ausgang 

30 100B des Parallelrechner-Bausteins 76B ist parallel 
mit den Eingangen 102C und 102D der Speicher- 
blocke 66C und 66D verbunden. 

Das Auslesen von Ergebnisdaten aus dem Pa- 
rallelrechner 76 und das Einschreiben dieser Daten 

35 in die Datenschnittstelle 68 beginnt damit, da/3 eine 
Bitebene der Ergebnisvariablen, z.B. die Ebene der 
geringstwertigen Bits, in die aus den 
Kommunikations-Registern 84 aufgebaute Trans- 
portschicht geladen wird. Zugleich werden die x- 

40 Adresse und die y-Adresse auf "0" gestellt. Die 
Schreibfreigabe-Signale der Speicherblocke 66A 
und 66C werden uber die Schreibfreigabe-Leitung 
90AC aufgeschaltet. An einem Ausgang 100A des 
Parallelrechner-Bausteins 76A stehen dabei z.B. 

45 die geringstwertigen Bits der Daten Nr. 0, 32, 64, 
96 ... an. 

Bei den folgenden Operationen wird die Daten- 
schnittstelle mit dem Arbeitstakt des Parallelrech- 
ners 76 gesteuert. 
so Mit jedem Arbeitstakt des Parallelrechners ge- 
schieht nun folgendes: 

- Die an den Ausgangen 100A und 100B an- 
stehenden Daten werden mit jeweils acht Bit 
parallel in "vertikale" Speicherzellen der 

55 SpeicherblScke 66A und 66C mit schrittweise 

verSnderten z-Adressen zunSchst mit der x- 
Adresse "0" eingeschrieben. 

- In der Transportschicht erfolgt ein Transport 
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der Bitebene jeweils um einen Schritt von Ost 
nach West, so daB z.B. nach dem ersten 
Arbeitstakt die geringstwertigen Bits der Er- 
gebnisvariablen Nr. 1 , 33, 65, 97 an dem 
Rand der Transportschicht am Ausgang 100A 
anstehen. 

- Nach acht Schritten der z-Adresse ist die 
Bitebene der geringstwertigen Bits aus den 
Parallelrechner-Bausteinen 76A und 76 B im 
Format 8x8 in die jeweils linke "vertikale" 
Schicht von Speicherelementen der Spei- 
cherblocke 66A bzw. 66C iibertragen. 

- Danach wird die nSchste Bitebene in die 
Transportschicht der Parallelrechner- Baustei- 
ne 76A und 76B "angehoben". 

- Gleichzeitig wird die x-Adresse nach jeweils 
acht Schritten der z-Adresse in Schritten ver- 
andert, wobei vor jedem Schritt die z-Adresse 
auf "0" zurGckgestellt wird und nach jedem 
Schritt der x-Adresse bei festgehaltener y- 
Adresse die z-Adresse wieder schrittweise 
verSndert wird. 

- Dieser Vorgang wird wiederholt bis acht Bit- 
ebenen der Parallelrechner-Bausteine 76A 
und 76B als "vertikale" Schichten in den 
Speicherblocken 66A bzw. 66C gespeichert 
sind. 

Zur Obertragung der nachsten acht Bitebenen 
der Ergebnisvariablen in den Parallelrechner-Bau- 
steinen 76A und 76B wird das Schreibfreigabe- 
Signal von der Schreibfreigabe-Leitung 90AC abe- 
schaltet und dafOr ein Schreibfreigabe-Signal Uber 
eine Schreibfreigabe-Leitung 90BD auf die Spei- 
cherblocke 66B und 66C aufgeschaltet. Der vorste- 
hend geschilderte Vorgang wiederholt sich dann. 
Dabei werden jetzt die Bitebenen der nachsten 
acht Bit bis zu dem hochstwertigen Bit in 
"vertikale, von vorn nach hinten verlaufende" 
Schichten der Speicherblocke 66B und 66D Uber- 
tragen. 

In gleicher Weise und gleichzeitig erfolgt die 
Obertragung der Bitebenen der Ergebnisvariablen 
aus den Parallelrechner-Bausteinen 76C und 76D 
auf die in gleicher Weise wie die Speicherbaustei- 
ne 66A, 66B, 66C und 66D aufgebauten und orga- 
nisierten (nicht dargestellten) Speicherbausteine 
der zweiten Datenschnittstelle. 

FUr die Obertragung einer Variablenschicht von 
sechzehn Bit "Dicke" aus dem Parallelrechner sind 
somit 

N GES = 16 x (8+1) = 144 

Arbeitstakte des Parallelrechners 76 benotigt. Bei 
einer Taktfrequenz von 16 MHz und dementspre- 
chend einer Taktperiode von 62,5 ns ergibt sich 
eine Zeit von 9us fur die Obertragung der gesam- 
ten Schicht von Ergebnisvariablen auf die Spei- 



cherblocke. 

Ahnlich wie bei der Eingabe von Daten in den 
Parallelrechner ist das Einschreiben der Daten in 
die DatenSchnittstelle nur eine Teilaufgabe. Die Da- 
5 ten mOssen aus der Datenschnittstelle ausgelesen 
und als Datenstrom von wortseriell und bitparallel 
auftretenden Datenworten von sechzehn Bit fUr die 
Weiterverarbeitung ausgegeben werden. Die Da- 
tenschnittstelle enthSIt daher zwei Speicher. Auf 

w einen Speicher werden in der im Zusammenhang 
mit Fig. 11 beschriebenen Weise die Ergebnisvari- 
ablen aus dem Parallelrechner 76 Bitebene fOr 
Bitebene Qbertragen. Der jeweils andere Speicher 
gibt inzwischen die gespeicherten Daten als Daten- 

T5 strom von Ergebnisvariablen mit sechzehn Bit bit- 
parallel und wortseriell ab. Rg.12 veranschaulicht 
die Ausgabe der Ergebnisvariablen aus der Daten- 
schnittstelle. 

Bei der Ausgabe der Ergebnisvariablen aus 

20 den Speicherblocken 66A, 66B, 66C und 66D sind 
die Schreibfreigabe-Leitungen aller Speicherblocke 
inaktiv. Dadurch wird ein versehentliches Uber- 
schreiben bereits gespeicherter Daten verhindert. 
Die Speicherblocke 66A, 66B, 66C und 66D haben 

25 je einen Ausgang 104A, 104B, 104C bzw. 104D 
von jeweils acht Bit Breite. An den Ausgangen 
104A, 104B, 104C und 104D liegen jeweils acht 
Speicherelemente mit einer bestimmten y-Adresse 
und einer bestimmten z-Adresse, und zwar die 

30 Speicherelemente mit alien dazugehorigen x- 
Adressen. Das ist jeweils eine "waagerecht von 
links nach rechts in Rg.12 verlaufende "SSule". In 
Fig.12 sind die an den AusgSngen 104A und 104B 
fUr die y-Adresse "0" und die z-Adresse "0" 

35 schraffiert dargestellt. Die jeweils an den AusgSn- 
gen 104A und 104B bitparallel erscheinenden Wor- 
te von je acht Bit werden auf einem Bus 106 von 
sechzehn Bit Breite zu Worten von je sechzehn Bit 
zusammengesetzt. Entsprechend werden die Worte 

40 von je acht Bit Breite an den Ausgangen 1040 und 
104D auf dem Bus 106 zu Worten von je sechzehn 
Bit zusammengesetzt. 

Die Ausgabe der Ergebnisvariablen aus den 
Speicherblocken 66A, 66B, 66C und 66D erfolgt 

45 auf folgende Weise: 

- Es werden zunachst nur die Ausgange 104A 
und 104B der Speicherblocke 66A und 66B 
aktiviert 

• Die y-Adresse und die z-Adresse werden auf 
so "0" gesetzt. Alle x-Adressen werden ange- 

sprochen. 

- Die an den Ausgangen 104A und 104B an- 
stehenden Worte werden zu einem sechzehn 
Bit Wort auf dem Bus 106 zusammengesetzt. 

55 - Die y-Adresse wird schrittweise erhdht. Die 
dabei an den Ausgangen 104A und 104B 
erscheinenden Worte werden ebenfalls auf 
dem Bus 106 paarweise zu Worten von sech- 
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zehn Bit zusammengesetzt 

- Nach acht so gebildeten Worten, wenn die y- 
Adresse "8" geworden ist, wird die y-Adresse 
auf "0" zurUckgesetzt 

- Die z-Adresse wird urn eins erhdht und dann 
wieder die y-Adresse stufenweise bis "7" er- 
hoht und bei "8" zurUckgesetzt. 

Oieser Vorgang wird wiederholt, bis alle in den 
Speicherblocken 66A und 66B gespeicherten Er- 
gebnisvariablen bitparallel und wortseriell auf dem 
Bus 106 ausgegeben worden sind. Dann werden 
die Ausgange 104C und 104D aktiviert. Die Ergeb- 
nisvariablen aus den beiden Speicherblocken 66C 
und 66D werden in gleicher Weise ausgegeben. 

Die Steuerung der Datenschnittstelle erfolgt 
durch Direktzugriffspeicher (ROMs) 108, 110, 112 
und 114 (Fig.13), in denen die Steuerbefehle ge- 
speichert sind. Die Direktzugriffspeicher 108, 110, 
112 und 114 werden von einem Zahler mit zwdlf 
Bit gesteuert. Dieser ZShler iiefert die Adressen 
der Steuerbefehle, die in den Direktzugriffspeichern 
108, 110, 112 und 114 gespeichert sind. Diese 
Steuerbefehle sind beispielsweise Steuerbefehle 
zur Aufschaltung von Schreibfreigabe- Signalen 
Oder zur Freigabe der Datenausgabe sowie zur 
Steuerung der Datenwege. 

Die Datenschnittstelle 68 weist zwei Uberein- 
stimmende Teilbereiche 68A und 68B auf. Jeder 
der Teilbereiche ist von zwei Direktzugriffspeichern 
108, 110 bzw. 112,114 steuerbar. Jeder der Teilbe- 
reiche 68A und 68B ist in der Lage, sowohl die 
Datenversorgung als auch die Datenentsorgung ei- 
nes Parallelrechners in der oben beschriebenen 
Weise durchzufuhren. 

Die beiden Teilbereiche kdnnen unterschiedlich 
angesteuert werden, so dafl ein Teilbereich, 
Z.B.68A, Daten in einem Format ubernimmt und 
der andere Teilbereich, z:B. 68B, gleichzeitig Daten 
in einem anderen Format ausgibt. Die beiden Teil- 
bereiche und die zugehdrigen Mikroprogramme 
konnen dabei mit unterschiedlichen Taktraten ar- 
beiten. Dabei werden Daten mit einer ersten Tak- 
trate Di z.B. von dem Teilbereich 68A im bitparal- 
lelen, wortseriellen Datenformat empfangen und 
gleichzeitig bereits umformatierte Daten mit einer 
zweiten Taktrate D2 an den Parallelrechner 76 ab- 
gegeben. Gleichzeitig werden bei der Datenentsor- 
gung von dem anderen Teilbereich 68B Daten im 
wortparallelen, bitseriellen Format mit der Datenra- 
te D2 von dem Parallelrechner 76 Ubernommen 
und umformatiert, wobei umformatierte Daten mit 
einer dritten Datenrate D 3 abgegeben wird. 

Mit der beschriebenen Struktur kdnnen auch 
andere Datenformate und/oder Anordnungen eines 
Parallelrechners bedient werden. 

Die Speicherbldcke 66A, 66B, 66C, 66D haben 
jeweils eine Tiefe von zweiunddreiflig Speicherzel- 
len. Die Speicherbldcke 66A, 66B, 66C und 66D 



sind daher nur zu einem Viertel gefUllt. Es konnen 
daher bis zu 1 024 Daten in den Speicherblocken 
abgelegt werden. 

Die Verteilung der 256 eingegebenen Daten 

5 auf die vier Speicherbldcke 66A, 66B, 66C und 
66D wurde aus ZeitgrUnden gewahlt. Tatsachlich 
hatte der gesamte Datensatz auch in einem Spei- 
cherblock, z.B. Speicherblock 66A abgelegt werden 
konnen. Die weiteren Speicherbldcke 66B, 66C, 

10 66D stUnden dann fOr die Ubernahme der nachfol- 
genden Datensatze zur VerfUgung. Auch kleinere 
Datensatze, z.B. kUrzere Zeilenformate bei der 
Bildverarbeitung kdnnen mit der beschriebenen 
Datenschnittstelle verarbeitet werden. Allerdings 

75 sollte dann die Form des Arrays von Prozessorele- 
menten 10 des Parallelrechners 76 an dieses ande- 
re Zeilenformat angepaflt werden. Anderenfalls 
wUrden bei Nachbarschaftsoperationen ungUltige 
Randdaten auftreten. 

20 Auch andere Strukturen eines Parallelrechners 
konnen mit der beschriebenen Datenschnittstelle 
mit Daten versorgt werden. 

Es ist beispielsweise mdglich, jeweils einem 
Speicherblock, z.B. 66A, vier in "Ost-West"-Rich- 

25 tung verbundene Paralielrechner-Bausteine zuzu- 
ordnen und den Parallelrechner in "Nord-SUd"- 
Richtung auszudehnen. Die Gbrigen drei Speicher- 
bldcke 66B, 66C und 66D wUrden dann drei zu- 
satzliche Zeilen von Parallelrechner- Bausteinen pa- 

30 rallel mit Daten versorgen. Es ist auch mdgiich, 
jeweils einen Speicherblock zwei Parallelrechner- 
Bausteinen zuzuordnen. Es konnen auch zwei Da- 
tenschnittstellen in Serie betrieben werden. Die da- 
bei erhaltenen acht Speicherausgange konnen 

35 dann acht Parallelrechner-Bausteinen zugeordnet 
werden, die ahnlich wie in Fig.7 in "Ost-West"- 
Richtung miteinander verbunden sind. Eine solche 
Anordnung wUrde bei der Bildverarbeitung eine 
Zeilenlange von 512 Bildelementen (Pixeln) zulas- 

40 sen. 

PatentansprUche 

1. Datenschnittstelle zur Wandlung zwischen bit- 
45 parallel und wortseriell vorliegenden Datenmu- 

stern und bitseriell und wortparallel vorliegen- 
den Datenmustern in Verbindung mit einem 
Parallelrechner 

50 dadurch gekennzeichnet, dad 



(a) dem Parallelrechner ein dreidimensional 
organisierter Datenspeicher (66) mit einer 
55 dreidimensionalen Adressierung vor- 

und/oder nachgeschaltet ist, bei welcher 
jede Adresse von drei Komponenten gebil- 
det ist, von denen eine erste Komponente 
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(x) die Wertigkeit eines Bits in einem Wort, 
die zweite Komponente (y) die laufende 
Zahl des Wortes in einer Folge von Worten 
und die dritte Komponente (z) die laufende 
Zahl der Folge angibt, zu der das Wort 5 
gehSrt, 

(b) dem Datenspeicher ein Schaltnetzwerk 
zur Steuerung des Datenspeichers zugeord- 
net ist, 

(c) in dem Datenspeicher w 
- ein ankommender bitparallel und wort- 

seriell formatierter Datenstrom zwi- 
schenspeicherbar ist, wobei die Daten 
von dem Datenspeicher (66) als bitse- 
rielles und wortparalleles Datenmuster 75 
in Form von "Bitebenen" (26) mit glei- 
chen Bitadressen auf einen Parallel- 
rechner (76) aufschaltbar sind, 
und/oder in dem Datenspeicher ein 
vom Parallelrechner (76) gelieferter, 20 
bitseriell und wortparallel als Folge 
von "Bitebenen" organisierter Daten- 
strom zwischenspeicherbar ist, wobei 
die Daten als bitparalleles und wortse- 
rielles Datenmuster ausgebbar sind. 25 

2. Datenschnittstelle nach Anspruch 1, dadurch 
gekennzelchnet, daj3 zur Adressierung des 
Datenspeichers (66) und zur Steuerung der 
Datenwege ein Mikroprogramm vorgesehen ist. 30 

3. Datenschnittstelle nach Anspruch 1, dadurch 
gekennzelchnet, 6aB der Datenspeicher (66) 
aus zwei Teilbereichen (68A.68B) mit jeweils 
zugeh6rigem Schaltnetzwerk aufgebaut ist. 35 

4. Datenschnittstelle nach Anspruch 3, dadurch 
gekennzelchnet, daj3 jeder der Teilbereiche 
(68A.68B) sowohl fUr die Wandlung des bitpa- 
rallel und wortserieil formatierten Datenstromes ao 
in ein wortparallel und bitserielles Datenmuster 

als auch fur die Wandlung eines wortparallel 
bitseriell formatierten Datenstromes in ein bit- 
parallel und wortserielles Datenmuster einge- 
richtet ist. 45 

5. Datenschnittstelle nach den AnsprUchen 2 und 
4, dadurch gekennzelchnet, da£ fUr die bei- 
den Teilbereiche (68A.68B) unabhangig von- 
einander ablaufende Mikroprogramme so 
(108,110:112,114) vorgesehen sind. 

6. Datenschnittstelle nach Anspruch 5, dadurch 
gekennzelchnet, dafl die beiden Mikropro- 
gramme zum Arbeiten mit unterschiedlichen 55 
Daten- und Taktraten eingerichtet sind. 
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